高有效性 (high availability) 是一個看起來是很不起眼的一環, 但確是足以決定成敗的一環, 當然這個是個大議題, 因為其內容還包含幾個層面:
容錯性 Fault Tolerance: 沒有一個系統不會出問題的, 所以須要很多很多系統去相互支援, 也就是 Redundancy 重覆的資源去達成本來只須要一個系統的要求.
安全性 Security: 當安全性出問題, 系統一定會有問題 Failure, 尤其是現在已經很難會須要設計封閉系統, 而當一開放, 自然有很多安全性的問題.
群組系統 Cluster System: 大部份的 HA 通常是靠 Cluster System, 或者是更延伸的 Cloud System 去完成, 用更多的資源去完成一件工作.
負載均衡 Load Balance: 無論是 Network LB, System LB 都是除了要解決 Fail Over 的問題, 更是提升其效率的一種方法.
高效能與效能調校 High Performance and Performance Tuning: 在實務上, 不可能只是為了達到有效性去降低效能, 甚至對效能的要求反而更高.
擴展性 Scalability: 沒有一個系統是一建製好就不會成長與升級的, 所以如何設計一套可以很輕易的在很低或沒有停機 Downtime 的情型下去擴充, 更是一個挑戰.
備份與復原 Backup and Recovery: 不太可能系統是永遠不出問題的, 因此一個好的備份與復元計劃是很重要的一環.
監控與警示 Monitor and Alert: 只要有可能出問題的問題就一定會出問題, 只是當出問題時要如何被知道以及要找誰解決?
版本控制與測試程序 Version Control and Test Process: 事實上出問題往往不是發生問題, 而是問題是被產生的, 尤其是內部造成的機會是最高的.
災難管理 Disaster Management: 最後是上面都出問題時該怎辦, 不要說是不會發生, 無論是天災還是人禍.
上面這 10 點大概就涵蓋了 90% 以上跟 HA 有關的元素與議題, 所以當你以為高有效性是一個很簡單的東西, 那你就錯了, 這是一個在某方面是很專業的事, 有時是比一般網管有更多的專業, 比一般的系統分析有更多的經驗, 千萬不要以為只要找任何一個 IT 的人就足以擔當大任, 尤其是這部份所須要的資源是比現有的資源要兩倍甚至三倍以上, 因此要對整個 Business Plan 或 Business Intelligence 有足夠的了解才行, 才能夠去知道那些去做取捨.
在未來的 30 天中, 我又想嘗試寫出沒人寫過這樣的專題, 且也蠻希望透過這個題目讓自己做個檢視與經驗的傳承, 畢竟工作是相當忙的, 說要停下來咀嚼也是要看機緣, 有時今年覺得工作很累就想偷懶, 但我知道這個挑戰不是為了別人, 而是為了自己, 但若能夠透過這機會也能讓大家有一點收獲是我最樂於見到的事, 也知道這時候是大家最樂於討論的時機, 若錯過了就會覺得可惜吧, 所以再累還是得寫阿.
畢竟這 30 篇依我的個性除了原創外更還有時不用舊文, 不然就失去我心目中鐵人的意義了, 所以就從今天開始吧.
嗯, 又厚顏無恥的來報名, 這才是應該很多人對我的想法吧, 嗚~~~ 淚奔...
終於來囉~~要常來咩!!
厚顏無恥+1